“AI歷經多輪演進,已邁入以推理為核心的全新階段。”3月17日,在2026華為資料儲存新春發佈會上,華為儲存產品線副總裁、快閃記憶體領域總裁謝黎明表示。發佈會上,華為正式發佈針對AI推理場景的全新AI資料基礎設施:面向中心推理場景的AI資料平台,以及面向分支邊緣推理場景的FusionCube A1000 AI超融合一體機。其中,AI資料平台瞄準解決推理業務中知識質量不高、長序列推理體驗差以及推理記憶缺失三大瓶頸。“企業資料在不斷變化與更新,如果知識轉化不及時,會導致模型的推理決策結果不精準。華為AI資料平台採用端到端的解析最佳化、表徵最佳化與檢索最佳化,將文字、圖片、視訊等資源轉化成海量細顆粒度的知識,結合多維度檢索與重排序,知識庫檢索精度超95%。”謝黎明說。在長文字長序列、多使用者多並行的推理過程中,大量的KV Cache資料存不下、系統響應遲緩,導致推理體驗惡化。華為AI資料平台針對性提供了全域分層快取能力,實現首Token(從使用者輸入完成到模型返回第一個響應Token的時間)時延降低90%。當前,大模型普遍缺乏持久的記憶,會遺忘多步驟的中間結果和長期沉澱的歷史經驗,無法真正實現自我進化。華為AI資料平台提供精準的記憶萃取與召回能力,實現上下文狀態保持、資訊凝練。據介紹,本次發佈的AI資料平台可提供一體化和獨立式兩大部署模式。一體化部署以OceanStor A800為全端一體機底座;獨立式部署採用“資料引擎節點+OceanStor Dorado”架構,可在現有儲存系統上新增資料引擎節點,保護歷史投資,支撐業務平滑轉型。此外,由於大量的資料是在分支邊緣場景產生的,針對傳統分支邊緣場景進行智能化改造過程中所面臨的部署複雜、成本高昂、效率低下等問題,華為推出FusionCube A1000 AI超融合一體機。FusionCube A1000採用通算與智算融合一體化架構,實現AI部署“開箱即用”。其內建的AI平台預整合了資料處理、模型訓練與推理全流程能力,基礎設施部署與應用上線周期縮短80%。FusionCube A1000支援邊緣與中心協同運行,打破資料孤島,形成智能體從感知到自主決策的閉環,還支援算力的動態切分與調度,單卡算力利用率提升約30%。“此次發佈的華為AI資料平台與FusionCube A1000,實現了從中心到邊緣的AI推理全場景覆蓋,期望能為AI技術廣泛行業化落地注入新動能。”謝黎明說。 (上海證券報)